iT邦幫忙

2025 iThome 鐵人賽

DAY 1
0
佛心分享-讓我升級的那些書

菜雞學習 pandas 的 30 日讀書分享系列 第 1

菜雞學習 pandas 的 30 日讀書分享【Day 1】前言

  • 分享至 

  • xImage
  •  

https://ithel7p.ithome.com.tw/upload/images/20250819/20168290HtqUw971xK.jpg

前言

這本書主要是在 Python 中操作、處理、清理和處理資料的各種細節,雖然本書的名字裡有「資料分析」,但本書的重點仍然是 Python 程式設計、程式庫以及工具,而不是資料分析方法論,它介紹的是用來分析資料的 Python 程式,不過我還是會以 pandas 為主進行介紹。

用哪種資料?

https://ithelp.ithome.com.tw/upload/images/20250801/20168290SpYSClB8x8.png

所謂的資料指的是結構化資料,結構化資料是一種統稱,它包含許多不同的形式。
例如:

  • 表格或試算表資料,每一條直欄都可以儲存不同的資料型態(字串、數字、日期、或其他),或是在以 Tab 或逗號分隔的檔案。
  • 多維陣列(矩陣)。
  • 用鍵欄(key columns)對 SQL 使用者而言,它就是主鍵或外鍵來建立關係的多個資料表。
  • 具有相同或是不同時間間隔的時間序列

以上僅列出部分的資料種類,多資料組乍看之下不屬於結構化資料,但都可以轉成適合用來分析和建立模型的結構,如果資料組無法轉換,我們也可以從中提取特徵,並轉換成結構化的形式。

舉例來說,可以將一堆新聞報導處理成一個單字頻率表格,然後用它來進行情緒分析。

Microsoft Excel 應該是世界上最普及的資料分析工具,Microsoft Excel 等試算表程式的使用者應該很熟悉上述的資料型式。

今日的分享就到這囉,我們明天見,掰掰!


下一篇
菜雞學習 pandas 的 30 日讀書分享【Day 2】為什麼
系列文
菜雞學習 pandas 的 30 日讀書分享30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言